13 research outputs found
Deep Convolutional Neural Networks as Generic Feature Extractors
Recognizing objects in natural images is an intricate problem involving
multiple conflicting objectives. Deep convolutional neural networks, trained on
large datasets, achieve convincing results and are currently the
state-of-the-art approach for this task. However, the long time needed to train
such deep networks is a major drawback. We tackled this problem by reusing a
previously trained network. For this purpose, we first trained a deep
convolutional network on the ILSVRC2012 dataset. We then maintained the learned
convolution kernels and only retrained the classification part on different
datasets. Using this approach, we achieved an accuracy of 67.68 % on CIFAR-100,
compared to the previous state-of-the-art result of 65.43 %. Furthermore, our
findings indicate that convolutional networks are able to learn generic feature
extractors that can be used for different tasks.Comment: 4 pages, accepted version for publication in Proceedings of the IEEE
International Joint Conference on Neural Networks (IJCNN), July 2015,
Killarney, Irelan
Intelligente Bildersuche durch den Einsatz inhaltsbasierter Techniken
Käster T. Intelligente Bildersuche durch den Einsatz inhaltsbasierter Techniken. Bielefeld (Germany): Bielefeld University; 2005.Heutzutage spielt die einfache Verwaltung großer Bestände von digitalen Bildern in vielen Anwendungsbereichen eine wichtige Rolle. Werbeleute, Journalisten und Designer benötigen den schnellen Zugang zu umfangreichen Bildkatalogen, um Werbungen, Artikel und Entwürfe durch entsprechende Bilder oder Bildelemente visuell hervorzuheben. Aber nicht nur im industriellen Bereich besteht die Anforderung einer organisierten Datenhaltung. Durch die Fortschritte in der Entwicklung elektronischer Geräte, wie z.B. digitale Fotokameras oder Scanner, nimmt die Menge an digitalen Bildern in privaten Haushalten tagtäglich zu. Anwender dieser Geräte werden zunehmend vor die Aufgabe gestellt, die zahlreichen Bilder strukturiert zu verwalten, um einfach in der gespeicherten Bildmenge navigieren zu können.
Seit den 70er Jahren haben sich textbasierte Bilddatenbanksysteme zur Verwaltung digitaler Bilder etabliert. Ihre Grundlage bildet die aufwändige manuelle Erfassung von Bildinhalten; die sogenannte Verschlagwortung. Obwohl textbasierte Bilddatenbanksysteme einen einfachen semantischen Zugang zu einer Menge von digitalen Bildern bieten, erfordern die verschiedenen Nachteile dieses Ansatzes, dass innovative Bildsuchsysteme entwickelt werden. Nachteile eines textbasierten Systems sind beispielsweise die subjektive Prägung der Verschlagwortung sowie der mangelnde visuelle Zugang zur gespeicherten Datenmenge.
Motiviert durch die Probleme verschlagworteter Systeme wurde seit Anfang der 90er Jahre verstärkt die Entwicklung sogenannter inhaltsbasierter Bildsuchsysteme vorangetrieben. Die rein inhaltsbasierte Bildersuche verzichtet auf die Verwendung von textuellen Annotationen und versucht einzig und allein auf der Grundlage visueller Bildmerkmale, die für eine Anfrage relevanten Bilder der Datenbank zu finden.
Da die inhaltsbasierte Bildersuche eine vielversprechende Alternative zur verschlagworteten Bildersuche darstellt, wurde sich in dieser Arbeit ausführlich mit diesem Thema beschäftigt. Den Mittelpunkt bildet dabei das im Rahmen eines BMB+F Verbundprojekts entwickelte Bildsuchsystem INDI. Das Ziel der vorliegenden Arbeit war die Entwicklung der für das INDI System benötigten inhaltsbasierten Suchmechanismen, sodass ein Anwender auf der Grundlage automatisch extrahierter Bildinhalte in der gespeicherten Bildmenge navigieren kann. Entsprechend den Eigenschaften moderner Bildsuchsysteme sollte das zu entwickelnde System dabei lernfähig sein und sich innerhalb des Suchprozesses an einen Anwender adaptieren können. Dazu wurde ein Suchverfahren entwickelt, das aus verschiedenen Komponenten besteht, die eine Adaption an die Suchintention eines Benutzers ermöglichen.
Da in dem Entwurf unterschiedliche Aspekte und Ansätze berücksichtigt wurden, war es Ziel einer ausführlichen Evaluation, die Systemkonfiguration zu bestimmen, mit der das INDI System am leistungsfähigsten ist. Um in dieser Arbeit auch der Fragestellung nachgehen zu können, inwieweit das Suchverfahren und adaptive Techniken im Allgemeinen skalierbar sind, wurde außerdem ein Verfahren zur Einschränkung des Suchraumes entwickelt. Ausgehend von der multidimensionalen Indizierung des gespeicherten Datenbestandes können somit auch für umfangreiche Bildmengen kurze Systemantwortzeiten erzielt werden
Fast, Illumination Insensitive Face Detection Based on Multilinear Techniques and Curvature Features
Abstrac
Benefits of Separable, Multilinear Classification
Bauckhage C, Käster T. Benefits of Separable, Multilinear Classification. In: Proc. of the Int. Conf. on Pattern Recognition (ICPR’06). Vol 3. IEEE; 2006: 1240-1243
Fast, Illumination Insensitive Face Detection Based on Multilinear Techniques and Curvature Features
Bauckhage C, Käster T. Fast, Illumination Insensitive Face Detection Based on Multilinear Techniques and Curvature Features. In: Proc. of the Int. Conf. on Pattern Recognition (ICPR’06). Vol 1. IEEE; 2006: 507-510
Usability Evaluation of Image Retrieval Beyond Desktop Applications
Käster T, Pfeiffer M, Bauckhage C. Usability Evaluation of Image Retrieval Beyond Desktop Applications. In: Proc. Int. Conf. on Multimedia and Expo. IEEE; 2006: 385-388
Content-Based Image Retrieval by Multimodal Interaction
Bauckhage C, Käster T, Pfeiffer M, Sagerer G. Content-Based Image Retrieval by Multimodal Interaction. In: Proc. of the 29th Annual Conference of the IEEE Industrial Electronics Society. Roanoke, VA; 2003: 1865-1870.Due to the size of todays professional image databases, the standard approach to content-based image retrieval is to interactively navigate through the content. However, most people whose job necessitates working with such databases do not have a technical background. Commercial practice thus requires efficient retrieval techniques as well as navigation interfaces that are intuitive to use and easy to learn. In this paper we introduce a system for interactive image retrieval that combines different approaches to feature based queries. Furthermore, it allows multimodal interaction because apart from conventional input devices like mouse and keyboard, it is possible to operate the system using a touch screen or even natural language. Besides technical details and results on retrieval accuracy, we will also present results of usability experiments which underline that users well appreciate multimodal interfaces for image retrieval